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(54) Verfahren und Anordnung zum Durchfuhren von Datenbankanfragen 

(57) Bei der Durchfuhrung von gesprochenen 
Datenbankanfragen werden die notwendigen Angaben 
haufig erst in einem Dialog zwischen dem System und 
dem Benutzer erhalten. Bei der Erkennung der gespro- 
chenen Anfrage bzw. der folgenden SprachauGerungen 
kennen beisptelsweise durch Erkennungsfehler Anga- 
ben erhalten werden, die nicht zueinander passen. Dies 
kann zu einer Veriangerung des Dialogs fuhren, die fur 
den Benutzer lastig ist, Oder gar zum erfolglosen 
Abbruch der Datenbankanfrage. Um diese Falle mOg- 
lichst weit zu verringern, wird erfindungsgemaS vorge- 
schlagen, die aus jeder AuBerung des Benutzers 
abgeleiteten Angaben for die Datenbankanfrage 
zunachst auf Konsistenz sowohl der Angaben miteinan- 
der als auch mit im fruheren Teil des Dialogs gewonne- 
nen Angaben zu prufen und beim Auftreten von 
Inkonsistenzen aus derselben SprachauBerung des 
Benutzers weitere Satze von Angaben abzuleiten, die 
eine abnehmend geringere akustische Ahnlichkeit mit 
dem Sprachsignal haben. Dadurch kennen Erken- 
nungsfehler verringert werden, so daR in haufigeren 
Fallen eine erfolgreiche Datenbankanfrage durchge- 
fuhrt werden kann. 
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Beschreibung 

Die Erfindung betrifft ein Verfahren zum Durchfuh- 
ren von Datenbankanfragen eines Benutzers aus 
SprachauBerungen in naturlicher Sprache sowie eine 
derartige Anordnung. 

Datenbankanfragen uber Tastatureingaben, die 
strengen Bedienungsregeln folgen, sind allgemein 
bekannt und werden nur von geschulten Benutzern 
durchgefuhrt. Es gibt jedoch auch Datenbanken, die 
von einem breiten, ungeschulten Publikum benutzt wer- 
den sollen, beispielsweise automatische Fahrptanaus- 
kunfte fur ZQge. Auskunfte fur Telefonnummern aus 
einem Teilnehmerverzeichnis Oder automatische Ver- 
mittlungen gewunschter Teilnehmer. Solche Daten- 
bankanfragen sollen fur den Benutzer mit mOglichst 
wenig technischen Mitteln durchfuhrbar sein, und dafur 
sind am besten gesprochene Datenbankanfragen 
geeignet, die insbesondere auch mittels Teiefbn durch- 
gefuhrt werden kdnnen. Ferner sollen fur solche Daten- 
bankanfragen moglichst wenige Oder praktisch keine 
formalen Regeln bestehen, damit jeder ungeubte 
Benutzer solche Datenbankanfragen durchfuhren kann. 

Ein Verfahren bzw. ein System zum Durchfuhren 
von Datenbankanfragen in Form naturlich gesproche- 
ner AuBerungen ist aus der EP 702 353 A2 (PHD 94- 
120) bekannt. Dabei wird das Sprachsignal in einer 
Erkennungsanordnung in Wfirter umgesetzt, aus denen 
ein Wortgraph gebildet wird, und aus diesem werden 
Angaben fur einen Datenbankzugriff abgeleitet. Sofern 
die Angaben fur einen vollstandigen Datenbankzugriff 
nicht ausreichen, wird ein Sprachsignal ausgegeben, 
das den Benutzer zur Abgabe weiterer SprachauBerun- 
gen veranlassen soli, aus denen dann weitere, insbe- 
sondere fehlende und korrigierte Angaben. abgeleitet 
werden. Aus jeder SprachauBerung wird jedoch prak- 
tisch nur ein Satz von Angaben abgeleitet und wenn 
diese Ableitung nicht richtig erfolgt, beispielsweise 
durch eine ungunstige Aussprache des Benutzers, ent- 
sprechen die abgeleiteten Angaben nicht dem, was der 
Benutzer sagen wollte. so daB haufigere Aufforderun- 
gen an den Benutzer durch das System erfolgen, die fur 
den Benutzer lastig sind. 

Aufgabe der Erfindung ist es, ein Verfahren sowie 
eine Anordnung anzugeben, das mit grdBerer Zuverias- 
sigkeit aus den vom Benutzer abgegebenen Sprachau- 
Berungen die wirklich vom Benutzer gemeirrten 
Angaben ableitet. 

Diese Aufgabe wird gemaB dem der Erfindung 
zugrunde liegenden Prinzip dadurch ge!6st, daB bei der 
Ableitung der Angaben aus der SprachauBerung alles 
Wissen des Systems mit der Datenbank fur Konsistenz- 
prufungen berucksichtigt wird. Dieses Wissen umfaBt 
zunachst die semantischen Regeln fur einen Satz von 
Angaben, d.h. die Angaben durfen nicht mehrdeutig 
sein. z.B. keine zwei Nachnamen bei einem Teilnehmer- 
verzeichnis Oder zwei Zielbahnhdfe bei einer Fahrplan- 
auskunft Weiter sollen die Angaben konsistent zu 



fruher im Dialog gewonnenen Angaben sein. wobei 
jedoch Ausnahmen mdgiich sind. beispielsweise wenn 
der Benutzer eine solche Angabe bei deren Wiederho- 
tung in einer Aufforderung des Systems ausdrucklich 

s verneint Ferner wird zumindest bei dem zuerst aus der 
SprachauBerung abgeleiteten Satz von Angaben. der 
am wahrscheinlichsten der SprachauBerung akustisch 
urrter Berucksichtigung eines Sprachmodelles ent- 
spricht. davon ausgegangen, daB die SprachauBerung 

io die der vorausgehenden Aufforderung des Systems 
entsprechenden Angaben enthait SchlieBlich wird die 
Konsistenz mit dem Datenbankinhalt gepruft. d.h. eine 
Angabe wie ein bestimmter Name, die nicht in der 
Datenbank enthalten ist, wird als Inkonsistenz behan- 

75 delt 

Diese Konsistenzprufung wird zuerst mit einem 
Satz von Angaben durchgefuhrt, der am wahrschein- 
lichsten der SprachauBerung entspricht, und wenig- 
stens beim Feststellen einer Inkonsistenz werden 

20 automatisch weitere Satze von Angaben mit nacheinan- 
der geringerer Wahrscheinlichkeit aus der SprachauBe- 
rung abgeleitet. Es kdnnen jedoch auch. ohne daB eine 
Inkonsistenz auftritt. weitere Satze von Angaben auf 
bestimmte Wahrscheinlichkeitskriterien untersucht wer- 

25 den. beispielsweise die Haufigkeit, mit der auf 
bestimmte Datenbankeintrage zugegriffen worden ist, 
und diese Haufigkeits-Wahrscheinlichkeit kombiniert 
mit der Erkennungswahrscheinlichkeit bestimmt. wel- 
cher Satz von Angaben ausgewahlt wird. Diese Ablei- 

30 tung von weiteren Satzen von Angaben aus der 
SprachauBerung erfolgt so lange, bis keine Inkonsisten- 
zen mehr festgestellt werden Oder bis ggf. ein anderes 
Kriterium erreicht wird, beispielsweise eine vorgege- 
bene Anzahl von Satzen von Angaben oder die Unter- 

35 schreitung eines vorgegebenen MaBes von Ahnlichkeit 
der Angaben *mit der SprachauBerung, die einem 
ungunstigen Bewertungswert bei den zu dem betreffen- 
den Satz von Angaben gehOrenden Wfirtern aufgrund 
der Worterkennung entspricht. Wenn kein Satz von 

40 Angaben ohne Inkonsistenzen erreicht wird, kann bei- 
spielsweise die vorhergehende Aufforderung des 
Systems an den Benutzer wiederholt werden. eine 
AuBerung fur bestimmte Angaben abzugeben. 

Bei der Prufung von Inkonsistenzen wird auch der 

45 Inhalt der vorhergehenden Aufforderung des Systems 
an den Benutzer einbezogen. Beispielsweise machen 
verneinende Angaben in einer AuBerung nur dann 
einen Sinn, wenn vorher eine entsprechende Aufforde- 
rung des Systems an den Benutzer abgegeben wurde. 

so Andererseits werden Angaben, die im vorhergehenden 
Dialog aus Aufforderung des Systems und SprachauBe- 
rungen des Benutzers als konsistent ermitteit worden 
waren. durch neue Angaben ersetzt. wenn letztere mit 
den ubrigen Angaben aus dem weiteren Verlauf des 

55 Dialogs konsistent sind und die neue Angabe auch 
genugend Zuveriassigkeit bei der Erkennung gezeigt 
hat. 

Ein Verfahren zum Ableiten von mehreren Wortfol- 
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gen aus einem Sprachsignal. das bei der vorliegenden 
Erfindung besonders vorteilhaft verwendet werden 
kann, ist in der prioritatsgleichen Patentanmeldung 1 96 
39 844.4 (PHD 96-168) angegeben. Dafur ist es zweck- 
maBig, wenn nach einer Ausgestaftung der Erfindung 
aus jeder SprachauBerung in der Erkennungsanord- 
nung ein Wortgraph gebildet wird, aus dem ein Kon- 
zeptgraph mit relevanten Angaben abgeleitet wird. 
wobei nur diese relevanten Angaben auf Konsistenz 
gepruft werden. Dies erspart Rechenzeit und verringert 
die MOglichkeit zu Fehlreaktionen des Systems auf- 
grund falsch erkannter Fullwflrter in der SprachauBe- 
rung. die fur den Datenbankzugriff nicht relevant sind. 

Zur Prufung von Inkonsistenzen eines Satzes von 
Angaben miteinander und mit den bereits im System 
enthaltenen Angaben aus dem vorhergehenden Verlauf 
des Dialogs kann zunachst ein vollstandiger Satz von 
Angaben oder auch mehrere Satze von Angaben mit 
abnehmender akustischer Ubereinstimmung mit der 
SprachauBerung abgeleitet werden, und die Angaben 
werden anschlieBend auf Konsistenz gepruft. bis ein 
Satz von Angaben ohne Inkonsistenzen festgestellt ist. 
Start dessen ist es jedoch auch moglich, die vollstan- 
dige Prufung auf Konsistenz fur jede relevante Angabe 
wahrend der Ableitung dieser Angabe aus dem Sprach- 
signal durchzufuhren und bei Feststellung einer Inkonsi- 
stenz die Ableitung des nachsten Satzes von Angaben 
zu beginnen. Damit kann zumindest in vielen Fallen der 
Verarbeitungsaufwand verringert werden. 

Es ist auch moglich, beim Auftreten einer Inkonsi- 
stenz den betreffenden Satz von Angaben nicht voll- 
standig zu verwerfen, sondern abhangig von der Art der 
Inkonsistenz diesem Satz von Angaben eine Bewertung 
zuzuteilen. Dann kann unter mehreren aufeinanderfol- 
genden Satzen von Angaben mit Inkonsistenzen derje- 
nige Satz von Angaben ausgewahlt werden, der die 
gunstigste bzw. die am wenigsten ungunstige Bewer- 
tung erhalten hat: 

Beispiele fur Inkonsistenzen sind beispielsweise 
bei einer Anfrage fur ein TelefonVermittlungssystem die 
Erkennung von zwei Nachnamen oder bei einem Zug- 
fahrplan-Auskunftssystem die Angabe von zwei Start- 
bahnhofen oder ZielbahnhCfen, die eine Inkonsistenz 
von Angaben untereinander darstellen. Eine weitere 
Inkonsistenz kann beispielsweise eine Angabe eines 
Namens oder eines Bahnhofs sein, die im Widerspruch 
zu vorhergehend gewonnenen Angaben steht, ohne 
daB vom System eine entsprechende Auffbrderung an 
den Benutzer gestellt wurde. insbesondere wenn diese 
vorhergehende Angabe vom Benutzer bereits bestatigt 
worden ist. Eine Inkonsistenz mit dem Datenbankinhalt 
tritt beispielsweise dann auf, wenn eine als Teilnehmer- 
name bzw. als Bahnhofsname ermittelte Angabe nicht 
m der Datenbank enthalten ist. In einem solchen Falle 
kann beispielsweise von dem System eine Aufforderung 
an den Benutzer ausgegeben werden, diesen Namen 
zu wiederholen. 

Ein Beispiel fur eine m&gliche Anordnung zur 



Durchfuhrung des beschriebenen Verfahrens ist in der 
Figur dargestellt. Darin ist ein Mikrofon 10 dargesteltt 
das eine SprachauBerung eines Benutzers aufnimmt 
und einer Anordnung 12 zufuhrt. in der diese Sprachau- 
5 Berung wiederholt abgetastet wird und die abgetasteten 
Sprachsignale in digitale Werte umgesetzt werden, aus 
denen das Sprachsignal kennzeichnende charakteristi- 
sche Werte abgeleitet werden. beispielsweise die 
Amplitude in verschiedenen Frequenzbandern. Diese 
w charaktenstischen Werte werden einer Anordnung 13 
zugefuhrt, in der diese Werte mit Referenzwerten aus 
einem Speicher 14 verglichen und aus den Vergleichs- 
werten Worthypothesen abgeleitet werden. 

Diese Anordnung 13 gibt die beendeten Worthypo- 
15 thesen als Wortgraph ab und fuhrt sie einer weiteren 
Anordnung 15 zu, in der aus dem Wortgraph mit Hilfe 
von in einem Speicher 16 gespeicherten Regeln ein 
sogenannter Konzeptgraph erzeugt wird, wie in der EP 
0 701 353 A2 (PHD 94-120) beschrieben ist. In dem 
20 Konzeptgraphen sind mehrere unterschiedliche Pfade 
vom Anfang bis zum Ende des Konzeptgraphen mdg- 
lich, die unterschiedliche Bewertungswerte aufweisen 
Diese Bewertungswerte werden aus den Bewertungs- 
werten des Wortgraphen und den Regeln gebildet und 
25 stellen ein MaB fur die akustische Wahrscheinlichkeit 
dar, daB die Folge von Konzepten in dem betreffenden 
Pfad durch den Konzeptgraphen der tatsachlich gespro- 
chenen SprachauBerung des Benutzers entspricht. 
Der Pfad mit der grSBten akustischen Wahrschein- 
30 hchkeit durch den Konzeptgraphen wird nun einer weite- 
ren Anordnung 20 zugefuhrt, in der die Konzepte auf 
diesem Pfad auf Konsistenz gepruft werden. Dazu wer- 
den zunachst die Konzepte untereinander auf Konsi- 
stenz, d.h. auf Widerspruchsfreiheit gepruft Ferner 
35 werden die Konzepte mit entsprechenden Konzepten 
verglichen, die bei vorgehenden Schritten des Dialogs 
zwischen dem Benutzer und dem System ermittelt wur- 
den und die in einem Speicher 24 zwischengespeichert 
sind. SchheBlich werden die Konzepte in der von der 
40 Anordnung 1 5 zugef uhrten Folge mit zumindest einigen 
Informationen der in einem Speicher 22 enthaltenen 
Datenbank verglichen. Dieser Speicher 22 ist ublicher- 
weise als Plattenspeicher mit groBer Speicherkapazitat 
realisiert. Beispielsweise wird gepruft, ob bestimmte 
45 Inhalte eines Konzepts, beispielsweise ein bestimmter 
Bahnhofsname bei einem Fahrplanauskunftssystem 
oder ein bestimmter Teilnehmername bei einem Tele- 
fonvermittlungssystem in der Datenbank im Speicher 22 
tatsachlich enthalten ist. 
so Sobald eine Inkonsistenz festgestellt wird. erzeugt 
die Anordnung 20 ein Signal an die Anordnung 1 5, wor- 
auf diese den Pfad mit nachstgeringerer akustischer 
Wahrscheinlichkeit durch den Konzeptgraphen abgibt. 
der in der Anordnung 20 in gleicher Weise auf Konsi- 
55 stenz gepruft wird. Dieser Vorgang wird wiederholt, bis 
keine Inkonsistenz mehr festgestellt wird oder bis eine 
vorgegebene Bedingung erreicht wird, beispielsweise 
eine vorgegebene Anzahl von Pfaden durch den Kon- 
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zeptgraphen in der Anordnung 15 ausgegeben wurde 
Oder bis eine vorgegebene akustische Wahrscheinlich- 
keit fur einen von der Anordnung 15 auszugebenden 
Pfad durch den Konzeptgraphen unterschritten wird. 

Wenn schlieBlich ein Pfad durch den Konzeptgra- 
phen ohne Inkonsistenzen festgestellt wird, werden die 
Inhalte der Konzepte zu den im Speicher enthaltenen 
Angaben hinzugefugt. und wenn alle Angaben fur alle 
Konzepte. die fur eine Datenbankanfrage erforderlich 
sind, vorhanden sind. wird aus den Angaben eine Infor- 
mation gebiidet und als Anfrageinformation an den 
Speicher 22 abgegeben. Die daraufhin vom Speicher 
22 abgegebenen Daten werden uber eine Ausgabean- 
ordnung 26 und einen Lautsprecher 30 an den Benutzer 
als Antwort auf seine gesprochene Anfrage ausgege- 
ben. 

Wenn jedoch noch nicht alle notwendigen Angaben 
vorhanden sind, beispielsweise weil fur ein Konzept 
noch keine ausreichend sichere Angabe ermittelt wor- 
den ist. oder wenn aus einer SprachauBerung des 
Benutzers keine konsistenten Angaben abgeleitet wer- 
den konnten und eine vorgegebene Abbruchbedingung 
erreicht wurde, wird an den Benutzer eine Aufforderung 
ausgegeben, eine weitere SprachauBerung abzuge- 
ben. 

Patentanspruche 

1. Verfahren zum Durchfuhren von Datenbankanfra- 
gen eines Benutzers in Form von SprachauBerun- 
gen in naturlicher Sprache, wobei jede 
SprachauBerung in einer Erkennungsanordnung in 
wenigstens einen Satz von Angaben mit grdBter 
akustischer Wahrscheinlichkeit unter Berucksichti- 
gung eines Sprachmodells umgesetzt wird, aus 
denen ein vollstandiger Datenbankzugriff abgeleitet 
wird, indem die einzelnen Angaben auf Konsistenz 
miteinander, auf Konsistenz mit aus vorhergehen- 
den SprachauBerungen bei derselben Datenbank- 
anfrage abgeleiteten Angaben und auf Konsistenz 
mit dem Datenbankinhalt gepruft werden und bei 
Feststellung von Inkonsistenzen weitere. aus der 
SprachauBerung umgesetzte Satze von Angaben 
mit abnehmender Wahrscheinlichkeit auf Konsi- 
stenz gepruft werden, bis keine Inkonsistenzen 
festgestellt werden und/oder bis ein weiteres Krite- 
rium erfullt ist, wobei ein auf diese Weise festge- 
stellter Satz von Angaben ohne Inkonsistenzen als 
Datenbankzugriff verwendet wird. 

2. Verfahren nach Anspruch 1, dadurch aekenn- 
zeichnet, 

daB aus jeder SprachauBetung in der Erkennungs- 
anordnung ein Wortgraph gebiidet wird. aus dem 
ein Konzeptgraph mit im wesentlichen nur fur die 
Datenbankanfrage relevarrten Angaben gebiidet 
wird, aus dem eine wahrscheinlichste Folge von 
relevanten Angaben abgeleitet wird. wobei nur die 



relevarrten Angaben auf Konsistenz gepruft wer- 
den. 

3. Verfahren nach Anspruch 2. dadurch qekenn- 
5 zeichnet. 

daB die vollstandige Prufung auf Konsistenz fur 
jede retevante Angabe wahrend der Bildung der 
Folge von Angaben durchgefuhrt wird und bei Fest- 
stellung einer Inkonsistenz die Bildung einer weite- 
w ten Folge von Angaben mit nachst geringerer 
Wahrscheinlichkeit begonnen wird. 

4. Anordnung zum DurchfOhren von Datenbankanfra- 
gen eines Benutzers in Form von SprachauBerun- 

is gen in naturlicher Sprache. mit 

einer Erkennungsanordnung (12 bis 16), um aus 
der SprachauBerung wenigstens einen Satz von 
Angaben mit groBter akustischer Wahrscheinlich- 
keit unter Berucksichtigung eines Sprachmodells 

20 abzuleiten und abzugeben, 

eine Speicheranordnung (22), die Informationen fur 
eine Datenbank enthait, die uber Anfrageinforma- 
tionen zugreifbar sind. 

eine Steueranordnung (20). um jeden von der 
25 Erkennungsanordnung (12 bis 16) abgegebenen 
Satz von Angaben durch Vergleich insbesondere 
mit den Angaben untereinander, mit vorher erzeug- 
ten Angaben und mit Informationen von der Daten- 
bank auf Konsistenz zu prufen und bei Feststellung 
30 von Inkonsistenz die Erkennungsanordnung (12 bis 
16) anzusteuern, wenigstens einen weiteren Satz 
von aus der SprachauBerung abgeleiteten Anga- 
ben mit geringerer akustischer Wahrscheinlichkeit 
abzugeben, und bei Feststellung von Konsistenz 
35 den Satz von Angaben fur eine Anfrageinformation 
an die Speicheranordnung (22) zu verwenden. 
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(57) Bei der Durchfuhrung von gesprochenen 
Datenbankanfragen werden die notwendigen Angaben 
haufig erst in einem Dialog zwischen dem System und 
dem Benutzer erhalten. Bei der Erkennung der gespro- 
chenen Anfrage bzw. der folgenden SprachauGerungen 
kbnnen beispielsweise durch Erkennungsfehler Anga- 
ben erhalten werden, die nicht zueinander passen. Dies 
kann zu einer Veriangerung des Dialogs fuhren, die fur 
den Benutzer lastig ist. Oder gar zum erfolglosen 
Abbruch der Datenbankanfrage. Urn diese Faile mOg- 
lichst weit zu verringern, wird erfindungsgemaB vorge- 
schlagen, die aus jeder AuGerung des Benutzers 
abgeleiteten Angaben fur die Datenbankanfrage 
zunachst auf Konsistenz sowohl der Angaben miteinan- 
der als auch mit im fruheren Teil des Dialogs gewonne- 
nen Angaben zu prufen und beim Auftreten von 
Inkonsistenzen aus derselben SprachauBerung des 
Benutzers weitere Satze von Angaben abzuleiten, die 
eine abnehmend geringere akustische Ahnlichkeit mit 
dem Sprachsignal haben. Dadurch kOnnen Erken- 
nungsfehler verringert werden, so da3 in haufigeren 
Fallen eine erfblgreiche Datenbankanfrage durchge- 
fuhrt werden kann. 
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